智能论文笔记

Verification of Sigmoidal Artificial Neural Networks using iSAT

Dominik Grundt , Sorin Liviu Jurj , Willem Hagemann , Paul Kröger , Martin Fränzle

分类：人工智能 | 机器学习

2022-07-14

本文提出了一种验证网络物理安全 - 关键系统中发现的非线性人工神经网络（ANN）行为的方法。我们将Sigmoid函数的专用间隔约束传播器实施到SMT求解器ISAT中，并将这种方法与组成方法进行比较，该方法通过ISAT中可用的基本算术特征和近似方法来编码Sigmoid函数。我们的实验结果表明，专用和组成方法明显优于近似方法。在我们所有的基准中，专门的方法与组成方法相比表现出相等或更好的性能。

translated by 谷歌翻译

Path Planning for Concentric Tube Robots: a Toolchain with Application to Stereotactic Neurosurgery

Matthias K. Hoffmann , Willem Esterhuizen , Karl Worthmann , Kathrin Flaßkamp

分类：机器人

2022-11-28

We present a toolchain for solving path planning problems for concentric tube robots through obstacle fields. First, ellipsoidal sets representing the target area and obstacles are constructed from labelled point clouds. Then, the nonlinear and highly nonconvex optimal control problem is solved by introducing a homotopy on the obstacle positions where at one extreme of the parameter the obstacles are removed from the operating space, and at the other extreme they are located at their intended positions. We present a detailed example (with more than a thousand obstacles) from stereotactic neurosurgery with real-world data obtained from labelled MPRI scans.

translated by 谷歌翻译

Hyperparameter optimization in deep multi-target prediction

Dimitrios Iliadis , Marcel Wever , Bernard De Baets , Willem Waegeman

分类：机器学习

2022-11-08

As a result of the ever increasing complexity of configuring and fine-tuning machine learning models, the field of automated machine learning (AutoML) has emerged over the past decade. However, software implementations like Auto-WEKA and Auto-sklearn typically focus on classical machine learning (ML) tasks such as classification and regression. Our work can be seen as the first attempt at offering a single AutoML framework for most problem settings that fall under the umbrella of multi-target prediction, which includes popular ML settings such as multi-label classification, multivariate regression, multi-task learning, dyadic prediction, matrix completion, and zero-shot learning. Automated problem selection and model configuration are achieved by extending DeepMTP, a general deep learning framework for MTP problem settings, with popular hyperparameter optimization (HPO) methods. Our extensive benchmarking across different datasets and MTP problem settings identifies cases where specific HPO methods outperform others.

translated by 谷歌翻译

A knee cannot have lung disease: out-of-distribution detection with in-distribution voting using the medical example of chest X-ray classification

Alessandro Wollek , Theresa Willem , Michael Ingrisch , Bastian Sabel , Tobias Lasser

分类：计算机视觉

2022-08-01

深度学习模型正在应用于越来越多的成功案例中，但是他们在现实世界中的表现如何？为了测试模型，组装了特定的清洁数据集。但是，当部署在现实世界中时，该模型将面临意外的分布（OOD）数据。在这项工作中，我们表明所谓的“放射科医生级” Chexnet模型未能识别所有OOD图像，并将其归类为肺部疾病。为了解决这个问题，我们提出了分发投票，这是一种对多标签分类的分布图像进行分类的新方法。使用在ID和OOD数据上训练的独立课程分布（ID）预测指标，我们平均达到99％的ID分类特异性和98％的敏感性，与胸部上以前的作品相比，端到端的性能显着提高X射线14个数据集。即使仅用ImageNet作为OOD数据训练并使用X射线OOD图像进行测试，我们的方法即使仅用Imagenet进行训练，也超过了其他基于输出的OOD检测器。

translated by 谷歌翻译

The Birth of Bias: A case study on the evolution of gender bias in an English language model

Oskar van der Wal , Jaap Jumelet , Katrin Schulz , Willem Zuidema

分类：自然语言处理 | 人工智能

2022-07-21

现代语言模型中的检测和缓解有害偏见被广泛认为是至关重要的开放问题。在本文中，我们退后一步，研究语言模型首先是如何偏见的。我们使用在英语Wikipedia语料库中训练的LSTM架构，使用相对较小的语言模型。在培训期间的每一步中，在每个步骤中都会更改数据和模型参数，我们可以详细介绍性别表示形式的发展，数据集中的哪些模式驱动器以及模型的内部状态如何与偏差相关在下游任务（语义文本相似性）中。我们发现性别的表示是动态的，并在训练过程中确定了不同的阶段。此外，我们表明，性别信息在模型的输入嵌入中越来越多地表示，因此，对这些性别的态度可以有效地减少下游偏置。监测训练动力学，使我们能够检测出在输入嵌入中如何表示男性和男性性别的不对称性。这很重要，因为这可能会导致幼稚的缓解策略引入新的不良偏见。我们更普遍地讨论了发现与缓解策略的相关性，以及将我们的方法推广到更大语言模型，变压器体系结构，其他语言和其他不良偏见的前景。

translated by 谷歌翻译

Less Is More: A Comparison of Active Learning Strategies for 3D Medical Image Segmentation

Josafat-Mattias Burmeister , Marcel Fernandez Rosas , Johannes Hagemann , Jonas Kordt , Jasper Blum , Simon Shabo , Benjamin Bergner , Christoph Lippert

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-02

由于标记医学图像数据是一个昂贵且劳动密集型的过程，因此近年来，Active学习在医学图像分割领域中广受欢迎。文献中已经提出了各种积极的学习策略，但是它们的有效性高度取决于数据集和培训方案。为了促进现有策略的比较，并为评估新策略提供了基准，我们评估了从医学分割的十项全能中的三个数据集上的几种著名的活跃学习策略的性能。此外，我们考虑了专门针对3D图像数据量身定制的扎实的采样策略。我们证明，随机和踩踏的采样都是强大的基准，并讨论了研究方法的优势和缺点。为了允许其他研究人员将他们的工作与我们的结果进行比较，我们提供了一个开源框架，以在各种医疗分割数据集上对主动学习策略进行基准测试。

translated by 谷歌翻译

Evolutionary Multi-Task Injection Testing on Web Application Firewalls

Ke Li , Heng Yang , Willem Visser

分类：神经与进化计算

2022-06-12

Web应用程序防火墙（WAF）如今扮演着不可或缺的角色，以保护Web应用程序免受SQL注入，XML注入和PHP注射等各种恶意注射攻击的影响。但是，鉴于注射攻击的复杂性不断发展，调整WAF的复杂性越来越复杂，确保WAF没有注射脆弱性是一项挑战，这样它将阻止所有恶意注射攻击而不会错误地影响合法信息。因此，自动测试WAF是及时且必不可少的任务。在本文中，我们提出了Danuoyi，这是一种自动注射测试工具，同时生成了对WAF上多种注射攻击的测试输入。我们的基本思想来自自然语言处理域中的跨语性翻译。特别是，不同类型的注射攻击的测试输入在句法上是不同的，但在语义上可能是相似的。因此，跨多种编程语言共享语义知识可以刺激更复杂的测试输入的产生，并发现WAF的注入脆弱性，原本很难找到。为此，在Danuoyi中，我们使用多任务学习来训练多个注射翻译模型，该学习将任何一对注射攻击之间的测试输入转换。然后，该模型由新型的多任务进化算法使用，以共同进化测试输入，以通过每一代人的共享交配池和特定于域的突变算子促进不同类型的注射攻击。我们对三个现实世界中的开源WAF和六种注射攻击进行了实验，结果表明，Danuoyi的生成高达3.8倍和5.78倍的有效测试输入（即，绕过基础WAF）比其最新的测试输入更大。 ART单项任务以及基于语法的注射结构。

translated by 谷歌翻译

PatchNR: Learning from Small Data by Patch Normalizing Flow Regularization

Fabian Altekrüger , Alexander Denker , Paul Hagemann , Johannes Hertrich , Peter Maass , Gabriele Steidl

分类：机器学习

2022-05-24

仅使用少量数据学习神经网络是一个重要的研究主题，具有巨大的应用潜力。在本文中，我们介绍了基于归一化流量的成像中反问题的变异建模的常规化器。我们的常规器称为PatchNR，涉及在很少的图像的贴片上学习的正常流。特别是，培训独立于考虑的逆问题，因此可以将相同的正规化程序用于在同一类图像上作用的不同前向操作员。通过研究斑块的分布与整个图像类别的分布，我们证明我们的变分模型确实是一种地图方法。如果有其他监督信息，我们的模型可以推广到有条件的补丁。材料图像和低剂量或限量角度计算机断层扫描（CT）的层分辨率的数值示例表明，我们的方法在具有相似假设的方法之间提供了高质量的结果，但仅需要很少的数据。

translated by 谷歌翻译

Learning Symmetric Embeddings for Equivariant World Models

Jung Yeon Park , Ondrej Biza , Linfeng Zhao , Jan Willem van de Meent , Robin Walters

分类：机器学习

2022-04-24

合并对称性可以通过定义通过转换相关的数据样本的等效类别来导致高度数据效率和可推广的模型。但是，表征转换如何在输入数据上作用通常很困难，从而限制了模型模型的适用性。我们提出了编码输入空间（例如图像）的学习对称嵌入网络（SENS），我们不知道转换的效果（例如旋转），以在这些操作下以已知方式转换的特征空间。可以通过模棱两可的任务网络端对端训练该网络，以学习明确的对称表示。我们在具有3种不同形式的对称形式的模棱两可的过渡模型的背景下验证了这种方法。我们的实验表明，SENS有助于将模棱两可的网络应用于具有复杂对称表示的数据。此外，相对于全等级和非等价基线的准确性和泛化可以提高准确性和概括。

translated by 谷歌翻译

A Unified Approach to Variational Autoencoders and Stochastic Normalizing Flows via Markov Chains

Johannes Hertrich , Paul Hagemann , Gabriele Steidl

分类：机器学习

2021-11-24

标准化流动，扩散归一化流量和变形自动置换器是强大的生成模型。在本文中，我们提供了一个统一的框架来通过马尔可夫链处理这些方法。实际上，我们考虑随机标准化流量作为一对马尔可夫链，满足一些属性，并表明许多用于数据生成的最先进模型适合该框架。马尔可夫链的观点使我们能够将确定性层作为可逆的神经网络和随机层作为大都会加速层，Langevin层和变形自身偏移，以数学上的声音方式。除了具有Langevin层的密度的层，扩散层或变形自身形式，也可以处理与确定性层或大都会加热器层没有密度的层。因此，我们的框架建立了一个有用的数学工具来结合各种方法。

translated by 谷歌翻译